110 research outputs found

    On building maps of web pages with a cellular automaton

    Get PDF
    We present in this paper a clustering algorithm which is based on a cellular automaton and which aims at displaying a map of web pages. We describe the main principles of methods that build such maps, and the main principles of cellular automata. We show how these principles can be applied to the problem of web pages clustering: the cells, which are organized in a 2D grid, can be either empty or may contain a page. The local transition function of cells favors the creation of groups of similar states (web pages) in neighbouring cells. We then present the visual results obtained with our method on standard data as well as on sets of documents. These documents are thus organized into a visual map which eases the browsing of these pages1st IFIP International Conference on Biologically Inspired Cooperative Computing - Web OrganizationRed de Universidades con Carreras en Informática (RedUNCI

    Développement de méthodes statistiques nécessaires à l'analyse de données génomiques (application à l'influence du polymorphisme génétique sur les caractéristiques cutanées individuelles et l'expression du vieillissement cutané.)

    Get PDF
    Les nouvelles technologies développées ces dernières années dans le domaine de la génétique ont permis de générer des bases de données de très grande dimension, en particulier de Single Nucleotide Polymorphisms (SNPs), ces bases étant souvent caractérisées par un nombre de variables largement supérieur au nombre d'individus. L'objectif de ce travail a été de développer des méthodes statistiques adaptées à ces jeux de données de grande dimension et permettant de sélectionner les variables les plus pertinentes au regard du problème biologique considéré. Dans la première partie de ce travail, un état de l'art présente différentes méthodes de sélection de variables non supervisées et supervisées pour 2 blocs de variables et plus. Dans la deuxième partie, deux nouvelles méthodes de sélection de variables non supervisées de type "sparse" sont proposées : la Group Sparse Principal Component Analysis (GSPCA) et l'Analyse des Correspondances Multiples sparse (ACM sparse). Vues comme des problèmes de régression avec une pénalisation group LASSO elles conduisent à la sélection de blocs de variables quantitatives et qualitatives, respectivement. La troisième partie est consacrée aux interactions entre SNPs et dans ce cadre, une méthode spécifique de détection d'interactions, la régression logique, est présentée. Enfin, la quatrième partie présente une application de ces méthodes sur un jeu de données réelles de SNPs afin d'étudier l'influence possible du polymorphisme génétique sur l'expression du vieillissement cutané au niveau du visage chez des femmes adultes. Les méthodes développées ont donné des résultats prometteurs répondant aux attentes des biologistes, et qui offrent de nouvelles perspectives de recherches intéressantesNew technologies developed recently in the field of genetic have generated high-dimensional databases, especially SNPs databases. These databases are often characterized by a number of variables much larger than the number of individuals. The goal of this dissertation was to develop appropriate statistical methods to analyse high-dimensional data, and to select the most biologically relevant variables. In the first part, I present the state of the art that describes unsupervised and supervised variables selection methods for two or more blocks of variables. In the second part, I present two new unsupervised "sparse" methods: Group Sparse Principal Component Analysis (GSPCA) and Sparse Multiple Correspondence Analysis (Sparse MCA). Considered as regression problems with a group LASSO penalization, these methods lead to select blocks of quantitative and qualitative variables, respectively. The third part is devoted to interactions between SNPs. A method employed to identify these interactions is presented: the logic regression. Finally, the last part presents an application of these methods on a real SNPs dataset to study the possible influence of genetic polymorphism on facial skin aging in adult women. The methods developed gave relevant results that confirmed the biologist's expectations and that offered new research perspectives.PARIS-CNAM (751032301) / SudocSudocFranceF

    On building maps of web pages with a cellular automaton

    Get PDF
    We present in this paper a clustering algorithm which is based on a cellular automaton and which aims at displaying a map of web pages. We describe the main principles of methods that build such maps, and the main principles of cellular automata. We show how these principles can be applied to the problem of web pages clustering: the cells, which are organized in a 2D grid, can be either empty or may contain a page. The local transition function of cells favors the creation of groups of similar states (web pages) in neighbouring cells. We then present the visual results obtained with our method on standard data as well as on sets of documents. These documents are thus organized into a visual map which eases the browsing of these pages1st IFIP International Conference on Biologically Inspired Cooperative Computing - Web OrganizationRed de Universidades con Carreras en Informática (RedUNCI

    Imagerie 3D

    No full text
    National audienc

    Exploration en réalité virtuelle d'un hypermédia 3D construit à partir d'images stéréoscopiques médicales

    No full text
    International audienceNous présentons dans cet article une nouvelle approche de construction et d'exploration en réalité virtuelle d'un hypermédia 3D dans le domaine médical. A partir de l'acquisition de photos stéréoscopiques et de la calibration des caméras, le système donne la possibilité à l'utilisateur de visualiser ces images en relief et d'annoter des zones des images avec du texte et du son. Ensuite, l'utilisateur peut définir des liens entre les annotations, et chaque annotation peut pointer vers d'autres annotations dans la même image ou dans d'autres images. L'utilisateur construit donc un hypermédia 3D. Il peut avoir une vue d'ensemble des images avec l'affichage d'un graphe d'images. Nous présentons un premier graphe construit sur des images de visages

    An artificial ants model for fast construction and approximation of proximity graphs

    No full text
    International audienceIn this paper we present a summary of our work which has led to the conception of a new model for the fast construction of proximity graphs. We present the state of the art in graph self-assembly, and then we detail the self-assembly behavior observed in real ants from which our model is derived. We describe our main algorithm, called AntGraph, where each ant represents one datum and where the proximity graph is built in an incremental way. Ants perform two steps: following the path of maximum local similarity, and then connecting to other ants. We present a hierarchical extension, called H-AntGraph, which can build large graphs (with up to 1 million data items). We study the properties of the constructed graphs, and compare our results with those obtained by other methods. We use force-directed graph layout algorithms to display the graphs and to allow the domain expert to perform an interactive clustering task. We validate this approach with a comparative user-study

    Understanding and reducing variability of SOM neighbourhood structure

    No full text
    The self-organizing map (SOM) is a nonlinear unsupervised method for vector quantization. In the context of classification and data analysis, the SOM technique highlights the neighbourhood structure between clusters. The correspondence between this clustering and the input proximity is called the topology preservation. We present here a stochastic method based on bootstrapping in order to increase the reliability of the induced neighbourhood structure. Considering the property of topology preservation, a local approach of variability (at an individual level) is preferred to a global one. The resulting (robust) map, called R-map, is more stable relatively to the choice of the sampling method and to the learning options of the SOM algorithm (initialization and order of data presentation). The method consists of selecting one map from a group of several solutions resulting from the same self-organizing map algorithm, but obtained with various inputs. The R-map can be thought of as the map, among the group of solutions, corresponding to the most common interpretation of the data set structure. The R-map is then the representative of a given SOM network, and the R-map ability to adjust the data structure indicates the relevance of the chosen network

    Classification hiérarchique et visualisation de pages Web

    No full text
    International audienceNous présentons dans cet article un nouvel algorithme de classification hiérarchique et non supervisée de documents noté AntTreeSans−Seuil. Il utilise le principe d'auto-assemblage observé chez des fourmis réelles qui construisent des structures vivantes en se connectant progressivement les unes aux autres. Nous adaptons ces principes pour construire un arbre de documents permettant de générer automatiquement des sites portails.Dans un premier temps, nous avons testé et validé AntTreeSans−Seuil sur des bases de données textuelles, suivie d'une étude comparative avec la méthode CAH. Enfin, dans un second temps, nous introduisons un affichage d'arbre dans un environnement immersif en trois dimensions permettant d'explorer le site portail construit
    • …
    corecore